この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
出典検索?: "統計学"
統計学(とうけいがく、英: statistics)とは、統計に関する研究を行う学問である。経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。統計的手法は、実験計画、データの要約や解釈を行う上での根拠を提供するため、幅広い分野で応用されている[注釈 1]。
物理学・経済学[2][3]・社会学・心理学[4]・言語学といった人文科学・社会科学・自然科学(基礎科学)から、工学・医学[5]・薬学といった応用科学まで、実証分析を伴う科学の分野において必須の学問となっている。また、科学哲学における重要なトピックの一つでもある。
語源詳細は「統計学の歴史#語源」を参照
英語で統計または統計学を「statistics(スタティスティクス)」と言うが、語源はラテン語で「状態」を意味する「statisticum(スタティスティークム)」であり、この言葉がイタリア語で「国家」を意味するようになり、国家の人力、財力等といった国勢調査を比較検討する学問を意味するようになった[要出典][注釈 2]。
なお、統計学という語は、ドイツの政治学者ゴットフリート・アッヘンヴァルが1749年に『ヨーロッパ諸国国家学綱要』の中で、それまでドイツ語で「Staatenkunde」(「国情論」の意味)と呼ばれていた[6]学問に「Statistik(シュタティシュティーク)」(統計学)の名をつけたことに始まる[7]。
日本語の「統計」という語の起源は明確にはなっていないが、幕末から明治初年にかけての洋学者である柳川春三が初めて現在の意味でこの語を使用したと考えられており、明治2年(1869年)には彼の編纂した冊子においてこの語と用法が使用されたとの記述がある。その後、明治4年(1871年)には大蔵省に「統計司」(後に「統計寮」に改組)が置かれ、次第にこの語が広まっていった[8]。
分類
記述統計学と推計統計学詳細は「Category:記述統計学」および「Category:推計統計学」を参照
統計学は「記述統計学 (descriptive statistics) 」 と「推計統計学(inferential statistics、推測統計学とも) 」に分類できる[9]。記述統計学はデータの特徴を記述する学問であり、推計統計学は標本から母集団を推計する学問である。
記述統計学は、データ1つがもつ特徴を記述・説明することに着目した分野である[9]。例えば小学生99人の身長データがあったとする。データの値は個別の小学生のものであり、100人全体の特徴は値を個別に見ただけでは分からない。ここでデータの値を身長順に並べ、50番目の値を見れば「この小学生99人の"普通"の身長はだいたい110 cmである」と記述できる。50番目の値は中央値という。このように、データ全体の特徴を要約・記述することが記述統計学の大きな目的・方法論である。
推計統計学は、母集団からの標本化を前提とし、標本から母集団を推測する分野である[9]。例えば世界の小学生の身長特性を知りたいとする。全世界の小学生の身長を計測し記述統計学によって中央値や平均値を記述すれば、目的である世界の小学生の身長特性は解明できる。しかしその計測は著しく困難(事実上不可能)である。そこで推計統計学では、まず小学生100人の身長データ(標本と呼ぶ)を集める。そして標本は全世界の小学生という母集団からランダムに選ばれたものだと考える。ランダムに選ばれた100人の身長中央値(標本の中央値)は必ずしも世界小学生身長中央値(母集団の中央値)と一致しないと考えられるが、"似た"数値にはなると期待される。すなわち標本から母集団の特性を推測することができる。この、標本から母集団を推測する方法論に関する分野が推計統計学である。
このように、記述統計学はデータ(推計統計学でいう標本)の説明・記述を行い、推計統計学は母集団(の記述)の推測をおこなう。両分野の違いは、記述統計学では目の前にあるデータがすべて(母集団という考え方はない)のに対し、推計統計学ではむしろ目の前のデータは(真なる)母集団から今回たまたま選ばれた標本だと考える点にある。一方で、推計統計学では標本の記述統計から母集団の統計量を推測するように、この2分野は非常に密接に絡んでおり全く別の分野と考えることは不適切である。 この節は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)
統計的手法
出典検索?: "統計学"
実験計画法
データ収集の規模や対象、割付方法をコントロールし、より公正で評価可能なデータが収集できるよう検討すること。統計の世界には「ゴミのようなデータを使っていくら解析しても出てくる結果はゴミばかりだ」[10]という格言がある[11]。これはデータ収集の前にその方法を十分に検討する必要があることを強調したものである。
尺度水準
データ(あるいは変数、測定)の尺度はふつう次のような種類(水準)に分類される。尺度水準によって、統計に用いるべき要約統計量や統計検定法が異なる。
質的データ、カテゴリデータ
名義尺度:単なる番号で順番の意味はない。電話番号、背番号など。
順序尺度:順序が意味を持つ番号。階級や階層など。
量的データ、数値データ
間隔尺度:順序に加え間隔にも意味がある(単位がある)が、ゼロには絶対的な意味はない。摂氏・華氏、知能指数など。
比率尺度:ゼロを基準とする絶対的尺度で、間隔だけでなく比率にも意味がある。絶対温度、金額など。
これらは、意思決定に応用されている。
歴史詳細は「統計学の歴史」を参照
統計学の源流は国家または社会全体における人口あるいは経済に関する調査にある[12]。このことは、東西を問わず古代から行われている。
学問としては、17世紀にはイギリスでウィリアム・ペティの『政治算術』(1790年)などが著述され、その後の社会統計学に繋がる流れが始まった。彼の提唱した政治算術そのものは18世紀に衰退するものの、ペティは統計学の父とも呼ばれる[13]。また同時期、ペティの友人であるジョン・グラント(英語: John Graunt)が『死亡表に関する自然的および政治的諸観察』(1662年)を表し、人口統計学の源流となった[14]。